В вашем варианте нужно использовать датасет food.
food <- read_csv("data/food.csv")
## Rows: 7083 Columns: 38
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (2): Category, Description
## dbl (36): Nutrient Data Bank Number, Data.Alpha Carotene, Data.Beta Carotene...
##
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
summary (food)
## Category Description Nutrient Data Bank Number
## Length:7083 Length:7083 Min. :11000000
## Class :character Class :character 1st Qu.:27150770
## Mode :character Mode :character Median :53260200
## Mean :48849646
## 3rd Qu.:67203450
## Max. :99998210
## Data.Alpha Carotene Data.Beta Carotene Data.Beta Cryptoxanthin
## Min. : 0.00 Min. : 0.0 Min. : 0.000
## 1st Qu.: 0.00 1st Qu.: 0.0 1st Qu.: 0.000
## Median : 0.00 Median : 8.0 Median : 0.000
## Mean : 43.76 Mean : 255.4 Mean : 4.862
## 3rd Qu.: 1.00 3rd Qu.: 73.0 3rd Qu.: 1.000
## Max. :4655.00 Max. :14134.0 Max. :1922.000
## Data.Carbohydrate Data.Cholesterol Data.Choline Data.Fiber
## Min. : 0.00 Min. : 0.00 Min. : 0.00 Min. : 0.000
## 1st Qu.: 5.65 1st Qu.: 0.00 1st Qu.: 10.00 1st Qu.: 0.100
## Median : 13.30 Median : 8.00 Median : 19.60 Median : 1.000
## Mean : 20.83 Mean : 34.46 Mean : 34.44 Mean : 1.704
## 3rd Qu.: 26.20 3rd Qu.: 46.00 3rd Qu.: 44.20 3rd Qu.: 2.100
## Max. :100.00 Max. :3074.00 Max. :820.20 Max. :46.200
## Data.Lutein and Zeaxanthin Data.Lycopene Data.Niacin
## Min. : 0.0 Min. : 0.0 Min. : 0.000
## 1st Qu.: 0.0 1st Qu.: 0.0 1st Qu.: 0.535
## Median : 18.0 Median : 0.0 Median : 1.487
## Mean : 213.4 Mean : 263.6 Mean : 2.647
## 3rd Qu.: 81.0 3rd Qu.: 0.0 3rd Qu.: 3.400
## Max. :15643.0 Max. :45902.0 Max. :127.500
## Data.Protein Data.Retinol Data.Riboflavin Data.Selenium
## Min. : 0.000 Min. : 0.00 Min. : 0.0000 Min. : 0.00
## 1st Qu.: 2.220 1st Qu.: 0.00 1st Qu.: 0.0600 1st Qu.: 1.70
## Median : 6.190 Median : 8.00 Median : 0.1240 Median : 8.10
## Mean : 8.599 Mean : 49.83 Mean : 0.1888 Mean : 13.09
## 3rd Qu.:12.130 3rd Qu.: 43.00 3rd Qu.: 0.2200 3rd Qu.: 20.00
## Max. :78.130 Max. :9349.00 Max. :17.5000 Max. :1917.00
## Data.Sugar Total Data.Thiamin Data.Water Data.Fat.Monosaturated Fat
## Min. : 0.000 Min. : 0.0000 Min. : 0.00 Min. : 0.000
## 1st Qu.: 0.780 1st Qu.: 0.0400 1st Qu.:45.90 1st Qu.: 0.513
## Median : 2.390 Median : 0.0870 Median :66.59 Median : 1.869
## Mean : 7.337 Mean : 0.1714 Mean :59.80 Mean : 3.218
## 3rd Qu.: 7.380 3rd Qu.: 0.1890 3rd Qu.:80.61 3rd Qu.: 4.433
## Max. :99.800 Max. :23.3750 Max. :99.98 Max. :75.221
## Data.Fat.Polysaturated Fat Data.Fat.Saturated Fat Data.Fat.Total Lipid
## Min. : 0.000 Min. : 0.000 Min. : 0.000
## 1st Qu.: 0.338 1st Qu.: 0.503 1st Qu.: 2.060
## Median : 1.036 Median : 1.444 Median : 5.480
## Mean : 2.174 Mean : 2.795 Mean : 8.958
## 3rd Qu.: 2.625 3rd Qu.: 3.668 3rd Qu.: 12.650
## Max. :67.849 Max. :82.500 Max. :100.000
## Data.Major Minerals.Calcium Data.Major Minerals.Copper
## Min. : 0.00 Min. : 0.0000
## 1st Qu.: 14.00 1st Qu.: 0.0500
## Median : 37.00 Median : 0.0790
## Mean : 73.47 Mean : 0.1416
## 3rd Qu.: 92.00 3rd Qu.: 0.1280
## Max. :1375.00 Max. :14.4660
## Data.Major Minerals.Iron Data.Major Minerals.Magnesium
## Min. : 0.000 Min. : 0.00
## 1st Qu.: 0.460 1st Qu.: 12.00
## Median : 1.040 Median : 20.00
## Mean : 1.752 Mean : 27.79
## 3rd Qu.: 1.840 3rd Qu.: 29.00
## Max. :64.100 Max. :611.00
## Data.Major Minerals.Phosphorus Data.Major Minerals.Potassium
## Min. : 0.0 Min. : 0.0
## 1st Qu.: 48.0 1st Qu.: 111.0
## Median : 102.0 Median : 183.0
## Mean : 133.1 Mean : 217.1
## 3rd Qu.: 189.0 3rd Qu.: 270.5
## Max. :1429.0 Max. :6040.0
## Data.Major Minerals.Sodium Data.Major Minerals.Zinc
## Min. : 0.0 Min. : 0.000
## 1st Qu.: 124.0 1st Qu.: 0.360
## Median : 313.0 Median : 0.680
## Mean : 340.5 Mean : 1.281
## 3rd Qu.: 454.0 3rd Qu.: 1.360
## Max. :7851.0 Max. :98.860
## Data.Vitamins.Vitamin A - RAE Data.Vitamins.Vitamin B12
## Min. : 0.00 Min. : 0.0000
## 1st Qu.: 2.00 1st Qu.: 0.0000
## Median : 20.00 Median : 0.1800
## Mean : 73.14 Mean : 0.7052
## 3rd Qu.: 61.00 3rd Qu.: 0.5500
## Max. :9363.00 Max. :82.4400
## Data.Vitamins.Vitamin B6 Data.Vitamins.Vitamin C Data.Vitamins.Vitamin E
## Min. : 0.0000 Min. : 0.000 Min. : 0.000
## 1st Qu.: 0.0520 1st Qu.: 0.000 1st Qu.: 0.230
## Median : 0.1100 Median : 0.700 Median : 0.550
## Mean : 0.1975 Mean : 5.696 Mean : 1.087
## 3rd Qu.: 0.2030 3rd Qu.: 5.300 3rd Qu.: 1.110
## Max. :12.0000 Max. :560.000 Max. :149.400
## Data.Vitamins.Vitamin K
## Min. : 0.00
## 1st Qu.: 0.80
## Median : 3.80
## Mean : 14.21
## 3rd Qu.: 9.30
## Max. :1640.00
Обоснование: нет пропущенных значений.
Переименуйте переменные в человекочитаемый вид (что делать с пробелами в названиях?);
В соответствии с описанием данных приведите переменные к нужному типу (numeric или factor);
Отсортируйте данные по возрасту (углеводам) по убыванию;
Сохраните в файл outliers.csv субъектов, которые являются выбросами (например, по правилу трёх сигм) — это необязательное задание со звёздочкой;
Отфильтруйте датасет так, чтобы остались только Rice и Cookie (переменная Category и есть группирующая);
Присвойте получившийся датасет переменной “cleaned_data”.
food %>% summarise_all(~ sum(is.na(.))) #проверка наличия пропущенных значений
names(food) <- names(food) %>% str_replace_all("\\.", "_") %>% str_replace_all(" ", "_") %>% str_remove_all("Data_") %>% str_remove_all ("-_|Major_|Fat_|Vitamins_")
outliers_ci <- food %>% mutate(Outlier = (Carbohydrate < quantile(Carbohydrate, 0.25) - IQR(Carbohydrate)*1.5 |
Carbohydrate > quantile(Carbohydrate, 0.75) + IQR(Carbohydrate)*1.5)) %>% filter(Outlier) # outliers СI
# Сохраним значения outliers в отдельный .csv
outliers <- food %>% mutate (Outlier1 = Carbohydrate > mean(Carbohydrate) + 3*sd(Carbohydrate) |
Carbohydrate < mean(Carbohydrate) - 3*sd(Carbohydrate)) %>% filter(Outlier1== T) %>% select (!Outlier1) # по правилу 3 сигм
write.csv(outliers, "outliers.csv", row.names = FALSE)
cleaned_data <- food %>% mutate (Category= as.factor(Category), `Nutrient_Bank_Number`= as.factor(`Nutrient_Bank_Number`)) %>% arrange(desc(Carbohydrate)) %>% filter (Category %in% c("Rice", "Cookie"))
cleaned_data$Category <- droplevels(cleaned_data$Category) # удалим убранные уровни фактора
length (cleaned_data)
## [1] 38
paste0 ("new dataframe contains ", length (cleaned_data) , " variables")
## [1] "new dataframe contains 38 variables"
nrow (cleaned_data)
## [1] 243
paste0 ("new dataframe contains ", nrow(cleaned_data) , " rows")
## [1] "new dataframe contains 243 rows"
dupl<-duplicated(cleaned_data)
ifelse (length (dupl [dupl== T]) >0 , "there are identical variables", "no indentical variables")
## [1] "no indentical variables"
# либо вывести идентичные строки
cleaned_data|>
group_by_all() |>
filter(n() > 1) |>
ungroup()
# с пропущенными значениями
var_with_NA<-cleaned_data %>% select (where(~sum(is.na(.)) > 0)) %>% length()
paste0 ("dataframe cleaned_data contains ", var_with_NA, " variables with missing values")
## [1] "dataframe cleaned_data contains 0 variables with missing values"
# сколько пропущенных значений в каждой переменной
food %>% summarise_all(~ sum(is.na(.))) %>% pivot_longer(cols = everything())
1.1) Количество значений;
1.2) Количество пропущенных значений;
1.3) Среднее;
1.4) Медиану;
1.5) Стандартное отклонение;
1.6) 25% квантиль и 75% квантиль;
1.7) Интерквартильный размах;
1.8) Минимум;
1.9) Максимум;
1.10) 95% ДИ для среднего - задание со звёздочкой.
statistics <- list(
`Количество значений` = ~length(.x) %>%as.character(),
`Количество пропущенных значений` = ~sum(is.na(.x)) %>%as.character(),
`Среднее значение` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", mean(.x, na.rm = TRUE) %>% round(2) %>% as.character()),
`Медиана` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", median (.x, na.rm = TRUE) %>% round(2) %>% as.character()),
`Станд. отклон.` = ~ifelse(sum(!is.na(.x)) < 3, "Н/П*", sd(.x, na.rm = TRUE) %>% round(2) %>% as.character()),
`Q1 - Q3` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", paste0(quantile(.x, 0.25, na.rm = TRUE) %>% round(2), " - ", quantile(.x, 0.75, na.rm = TRUE) %>% round(2))),
`IQR` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", round(quantile(.x, 0.75, na.rm = TRUE) - quantile(.x, 0.25, na.rm = TRUE), 2))%>% as.character(),
`мин. - макс.` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", paste0(min(.x, na.rm = TRUE) %>% round(2), " - ", max(.x, na.rm = TRUE) %>% round(2))),
`CI` = ~ifelse(sum(!is.na(.x)) == 0, "Н/П*", paste0( (mean(.x, na.rm = TRUE) - (1.96 * sd(.x, na.rm = TRUE)/sqrt (length(.x)))) %>% round(2) , " - ", (mean(.x, na.rm = TRUE) + (1.96 * sd(.x, na.rm = TRUE)/sqrt(length(.x)))) %>% round(2)))
)
cleaned_data %>%
select (Category, where ( is.numeric)) %>%
group_by (Category) %>%
summarise (across(where(is.numeric), statistics)) %>%
pivot_longer (!Category) %>%
separate (name, into = c ("Переменная", "Статистика"), sep= "_(?!.*_)") %>%
rename (`Значение` = value, `Категория` = Category) %>%
flextable()
Категория | Переменная | Статистика | Значение |
|---|---|---|---|
Cookie | Alpha_Carotene | Количество значений | 100 |
Cookie | Alpha_Carotene | Количество пропущенных значений | 0 |
Cookie | Alpha_Carotene | Среднее значение | 8.25 |
Cookie | Alpha_Carotene | Медиана | 0 |
Cookie | Alpha_Carotene | Станд. отклон. | 80.99 |
Cookie | Alpha_Carotene | Q1 - Q3 | 0 - 0 |
Cookie | Alpha_Carotene | IQR | 0 |
Cookie | Alpha_Carotene | мин. - макс. | 0 - 810 |
Cookie | Alpha_Carotene | CI | -7.62 - 24.12 |
Cookie | Beta_Carotene | Количество значений | 100 |
Cookie | Beta_Carotene | Количество пропущенных значений | 0 |
Cookie | Beta_Carotene | Среднее значение | 17.43 |
Cookie | Beta_Carotene | Медиана | 0 |
Cookie | Beta_Carotene | Станд. отклон. | 102.62 |
Cookie | Beta_Carotene | Q1 - Q3 | 0 - 1 |
Cookie | Beta_Carotene | IQR | 1 |
Cookie | Beta_Carotene | мин. - макс. | 0 - 1002 |
Cookie | Beta_Carotene | CI | -2.68 - 37.54 |
Cookie | Beta_Cryptoxanthin | Количество значений | 100 |
Cookie | Beta_Cryptoxanthin | Количество пропущенных значений | 0 |
Cookie | Beta_Cryptoxanthin | Среднее значение | 0.38 |
Cookie | Beta_Cryptoxanthin | Медиана | 0 |
Cookie | Beta_Cryptoxanthin | Станд. отклон. | 1.98 |
Cookie | Beta_Cryptoxanthin | Q1 - Q3 | 0 - 0 |
Cookie | Beta_Cryptoxanthin | IQR | 0 |
Cookie | Beta_Cryptoxanthin | мин. - макс. | 0 - 18 |
Cookie | Beta_Cryptoxanthin | CI | -0.01 - 0.77 |
Cookie | Carbohydrate | Количество значений | 100 |
Cookie | Carbohydrate | Количество пропущенных значений | 0 |
Cookie | Carbohydrate | Среднее значение | 68.09 |
Cookie | Carbohydrate | Медиана | 67.78 |
Cookie | Carbohydrate | Станд. отклон. | 6.95 |
Cookie | Carbohydrate | Q1 - Q3 | 63.87 - 72.22 |
Cookie | Carbohydrate | IQR | 8.35 |
Cookie | Carbohydrate | мин. - макс. | 50.52 - 84 |
Cookie | Carbohydrate | CI | 66.72 - 69.45 |
Cookie | Cholesterol | Количество значений | 100 |
Cookie | Cholesterol | Количество пропущенных значений | 0 |
Cookie | Cholesterol | Среднее значение | 8.68 |
Cookie | Cholesterol | Медиана | 0 |
Cookie | Cholesterol | Станд. отклон. | 26.92 |
Cookie | Cholesterol | Q1 - Q3 | 0 - 2 |
Cookie | Cholesterol | IQR | 2 |
Cookie | Cholesterol | мин. - макс. | 0 - 221 |
Cookie | Cholesterol | CI | 3.4 - 13.96 |
Cookie | Choline | Количество значений | 100 |
Cookie | Choline | Количество пропущенных значений | 0 |
Cookie | Choline | Среднее значение | 13.28 |
Cookie | Choline | Медиана | 11.05 |
Cookie | Choline | Станд. отклон. | 12.36 |
Cookie | Choline | Q1 - Q3 | 6.7 - 14.6 |
Cookie | Choline | IQR | 7.9 |
Cookie | Choline | мин. - макс. | 0 - 92 |
Cookie | Choline | CI | 10.85 - 15.7 |
Cookie | Fiber | Количество значений | 100 |
Cookie | Fiber | Количество пропущенных значений | 0 |
Cookie | Fiber | Среднее значение | 2.67 |
Cookie | Fiber | Медиана | 2.1 |
Cookie | Fiber | Станд. отклон. | 2.5 |
Cookie | Fiber | Q1 - Q3 | 1.48 - 3 |
Cookie | Fiber | IQR | 1.52 |
Cookie | Fiber | мин. - макс. | 0 - 16.1 |
Cookie | Fiber | CI | 2.18 - 3.16 |
Cookie | Lutein_and_Zeaxanthin | Количество значений | 100 |
Cookie | Lutein_and_Zeaxanthin | Количество пропущенных значений | 0 |
Cookie | Lutein_and_Zeaxanthin | Среднее значение | 23.15 |
Cookie | Lutein_and_Zeaxanthin | Медиана | 8 |
Cookie | Lutein_and_Zeaxanthin | Станд. отклон. | 38.93 |
Cookie | Lutein_and_Zeaxanthin | Q1 - Q3 | 3 - 29 |
Cookie | Lutein_and_Zeaxanthin | IQR | 26 |
Cookie | Lutein_and_Zeaxanthin | мин. - макс. | 0 - 266 |
Cookie | Lutein_and_Zeaxanthin | CI | 15.52 - 30.78 |
Cookie | Lycopene | Количество значений | 100 |
Cookie | Lycopene | Количество пропущенных значений | 0 |
Cookie | Lycopene | Среднее значение | 0.02 |
Cookie | Lycopene | Медиана | 0 |
Cookie | Lycopene | Станд. отклон. | 0.2 |
Cookie | Lycopene | Q1 - Q3 | 0 - 0 |
Cookie | Lycopene | IQR | 0 |
Cookie | Lycopene | мин. - макс. | 0 - 2 |
Cookie | Lycopene | CI | -0.02 - 0.06 |
Cookie | Niacin | Количество значений | 100 |
Cookie | Niacin | Количество пропущенных значений | 0 |
Cookie | Niacin | Среднее значение | 2.72 |
Cookie | Niacin | Медиана | 2.23 |
Cookie | Niacin | Станд. отклон. | 2.07 |
Cookie | Niacin | Q1 - Q3 | 1.75 - 3.14 |
Cookie | Niacin | IQR | 1.39 |
Cookie | Niacin | мин. - макс. | 0.05 - 15.97 |
Cookie | Niacin | CI | 2.31 - 3.12 |
Cookie | Protein | Количество значений | 100 |
Cookie | Protein | Количество пропущенных значений | 0 |
Cookie | Protein | Среднее значение | 5.34 |
Cookie | Protein | Медиана | 5 |
Cookie | Protein | Станд. отклон. | 2.16 |
Cookie | Protein | Q1 - Q3 | 3.8 - 6.2 |
Cookie | Protein | IQR | 2.4 |
Cookie | Protein | мин. - макс. | 2.19 - 12.5 |
Cookie | Protein | CI | 4.92 - 5.76 |
Cookie | Retinol | Количество значений | 100 |
Cookie | Retinol | Количество пропущенных значений | 0 |
Cookie | Retinol | Среднее значение | 20.13 |
Cookie | Retinol | Медиана | 0.5 |
Cookie | Retinol | Станд. отклон. | 57.16 |
Cookie | Retinol | Q1 - Q3 | 0 - 7 |
Cookie | Retinol | IQR | 7 |
Cookie | Retinol | мин. - макс. | 0 - 270 |
Cookie | Retinol | CI | 8.93 - 31.33 |
Cookie | Riboflavin | Количество значений | 100 |
Cookie | Riboflavin | Количество пропущенных значений | 0 |
Cookie | Riboflavin | Среднее значение | 0.28 |
Cookie | Riboflavin | Медиана | 0.23 |
Cookie | Riboflavin | Станд. отклон. | 0.33 |
Cookie | Riboflavin | Q1 - Q3 | 0.19 - 0.29 |
Cookie | Riboflavin | IQR | 0.11 |
Cookie | Riboflavin | мин. - макс. | 0.04 - 3.23 |
Cookie | Riboflavin | CI | 0.21 - 0.34 |
Cookie | Selenium | Количество значений | 100 |
Cookie | Selenium | Количество пропущенных значений | 0 |
Cookie | Selenium | Среднее значение | 8.13 |
Cookie | Selenium | Медиана | 6.3 |
Cookie | Selenium | Станд. отклон. | 4.98 |
Cookie | Selenium | Q1 - Q3 | 4.75 - 10 |
Cookie | Selenium | IQR | 5.25 |
Cookie | Selenium | мин. - макс. | 0 - 24.7 |
Cookie | Selenium | CI | 7.16 - 9.11 |
Cookie | Sugar_Total | Количество значений | 100 |
Cookie | Sugar_Total | Количество пропущенных значений | 0 |
Cookie | Sugar_Total | Среднее значение | 32.71 |
Cookie | Sugar_Total | Медиана | 32.9 |
Cookie | Sugar_Total | Станд. отклон. | 12.45 |
Cookie | Sugar_Total | Q1 - Q3 | 24.66 - 41.11 |
Cookie | Sugar_Total | IQR | 16.45 |
Cookie | Sugar_Total | мин. - макс. | 0 - 80.35 |
Cookie | Sugar_Total | CI | 30.27 - 35.15 |
Cookie | Thiamin | Количество значений | 100 |
Cookie | Thiamin | Количество пропущенных значений | 0 |
Cookie | Thiamin | Среднее значение | 0.27 |
Cookie | Thiamin | Медиана | 0.26 |
Cookie | Thiamin | Станд. отклон. | 0.18 |
Cookie | Thiamin | Q1 - Q3 | 0.18 - 0.3 |
Cookie | Thiamin | IQR | 0.12 |
Cookie | Thiamin | мин. - макс. | 0 - 1.46 |
Cookie | Thiamin | CI | 0.24 - 0.3 |
Cookie | Water | Количество значений | 100 |
Cookie | Water | Количество пропущенных значений | 0 |
Cookie | Water | Среднее значение | 7.89 |
Cookie | Water | Медиана | 5.76 |
Cookie | Water | Станд. отклон. | 5.79 |
Cookie | Water | Q1 - Q3 | 3.6 - 11.5 |
Cookie | Water | IQR | 7.9 |
Cookie | Water | мин. - макс. | 0.7 - 24.83 |
Cookie | Water | CI | 6.75 - 9.02 |
Cookie | Monosaturated_Fat | Количество значений | 100 |
Cookie | Monosaturated_Fat | Количество пропущенных значений | 0 |
Cookie | Monosaturated_Fat | Среднее значение | 6.08 |
Cookie | Monosaturated_Fat | Медиана | 6.07 |
Cookie | Monosaturated_Fat | Станд. отклон. | 3.23 |
Cookie | Monosaturated_Fat | Q1 - Q3 | 3.29 - 8.5 |
Cookie | Monosaturated_Fat | IQR | 5.21 |
Cookie | Monosaturated_Fat | мин. - макс. | 0 - 16.08 |
Cookie | Monosaturated_Fat | CI | 5.44 - 6.71 |
Cookie | Polysaturated_Fat | Количество значений | 100 |
Cookie | Polysaturated_Fat | Количество пропущенных значений | 0 |
Cookie | Polysaturated_Fat | Среднее значение | 4.12 |
Cookie | Polysaturated_Fat | Медиана | 3.26 |
Cookie | Polysaturated_Fat | Станд. отклон. | 2.62 |
Cookie | Polysaturated_Fat | Q1 - Q3 | 2.26 - 5.75 |
Cookie | Polysaturated_Fat | IQR | 3.49 |
Cookie | Polysaturated_Fat | мин. - макс. | 0 - 11.49 |
Cookie | Polysaturated_Fat | CI | 3.61 - 4.63 |
Cookie | Saturated_Fat | Количество значений | 100 |
Cookie | Saturated_Fat | Количество пропущенных значений | 0 |
Cookie | Saturated_Fat | Среднее значение | 6.04 |
Cookie | Saturated_Fat | Медиана | 4.61 |
Cookie | Saturated_Fat | Станд. отклон. | 4.58 |
Cookie | Saturated_Fat | Q1 - Q3 | 3.05 - 8.09 |
Cookie | Saturated_Fat | IQR | 5.04 |
Cookie | Saturated_Fat | мин. - макс. | 0 - 20.1 |
Cookie | Saturated_Fat | CI | 5.14 - 6.94 |
Cookie | Total_Lipid | Количество значений | 100 |
Cookie | Total_Lipid | Количество пропущенных значений | 0 |
Cookie | Total_Lipid | Среднее значение | 17.33 |
Cookie | Total_Lipid | Медиана | 17.95 |
Cookie | Total_Lipid | Станд. отклон. | 7.12 |
Cookie | Total_Lipid | Q1 - Q3 | 13.1 - 22.55 |
Cookie | Total_Lipid | IQR | 9.45 |
Cookie | Total_Lipid | мин. - макс. | 0.34 - 35.3 |
Cookie | Total_Lipid | CI | 15.93 - 18.72 |
Cookie | Minerals_Calcium | Количество значений | 100 |
Cookie | Minerals_Calcium | Количество пропущенных значений | 0 |
Cookie | Minerals_Calcium | Среднее значение | 33.18 |
Cookie | Minerals_Calcium | Медиана | 28 |
Cookie | Minerals_Calcium | Станд. отклон. | 35.29 |
Cookie | Minerals_Calcium | Q1 - Q3 | 12 - 46 |
Cookie | Minerals_Calcium | IQR | 34 |
Cookie | Minerals_Calcium | мин. - макс. | 0 - 263 |
Cookie | Minerals_Calcium | CI | 26.26 - 40.1 |
Cookie | Minerals_Copper | Количество значений | 100 |
Cookie | Minerals_Copper | Количество пропущенных значений | 0 |
Cookie | Minerals_Copper | Среднее значение | 0.2 |
Cookie | Minerals_Copper | Медиана | 0.18 |
Cookie | Minerals_Copper | Станд. отклон. | 0.11 |
Cookie | Minerals_Copper | Q1 - Q3 | 0.11 - 0.27 |
Cookie | Minerals_Copper | IQR | 0.16 |
Cookie | Minerals_Copper | мин. - макс. | 0.02 - 0.58 |
Cookie | Minerals_Copper | CI | 0.18 - 0.23 |
Cookie | Minerals_Iron | Количество значений | 100 |
Cookie | Minerals_Iron | Количество пропущенных значений | 0 |
Cookie | Minerals_Iron | Среднее значение | 3.03 |
Cookie | Minerals_Iron | Медиана | 2.58 |
Cookie | Minerals_Iron | Станд. отклон. | 1.91 |
Cookie | Minerals_Iron | Q1 - Q3 | 2.2 - 3.21 |
Cookie | Minerals_Iron | IQR | 1.01 |
Cookie | Minerals_Iron | мин. - макс. | 0 - 12.14 |
Cookie | Minerals_Iron | CI | 2.66 - 3.41 |
Cookie | Minerals_Magnesium | Количество значений | 100 |
Cookie | Minerals_Magnesium | Количество пропущенных значений | 0 |
Cookie | Minerals_Magnesium | Среднее значение | 30.81 |
Cookie | Minerals_Magnesium | Медиана | 31 |
Cookie | Minerals_Magnesium | Станд. отклон. | 16.97 |
Cookie | Minerals_Magnesium | Q1 - Q3 | 15.5 - 40.25 |
Cookie | Minerals_Magnesium | IQR | 24.75 |
Cookie | Minerals_Magnesium | мин. - макс. | 6 - 101 |
Cookie | Minerals_Magnesium | CI | 27.48 - 34.14 |
Cookie | Minerals_Phosphorus | Количество значений | 100 |
Cookie | Minerals_Phosphorus | Количество пропущенных значений | 0 |
Cookie | Minerals_Phosphorus | Среднее значение | 98.48 |
Cookie | Minerals_Phosphorus | Медиана | 94 |
Cookie | Minerals_Phosphorus | Станд. отклон. | 47.59 |
Cookie | Minerals_Phosphorus | Q1 - Q3 | 66 - 122.25 |
Cookie | Minerals_Phosphorus | IQR | 56.25 |
Cookie | Minerals_Phosphorus | мин. - макс. | 5 - 277 |
Cookie | Minerals_Phosphorus | CI | 89.15 - 107.81 |
Cookie | Minerals_Potassium | Количество значений | 100 |
Cookie | Minerals_Potassium | Количество пропущенных значений | 0 |
Cookie | Minerals_Potassium | Среднее значение | 170.69 |
Cookie | Minerals_Potassium | Медиана | 149 |
Cookie | Minerals_Potassium | Станд. отклон. | 90.42 |
Cookie | Minerals_Potassium | Q1 - Q3 | 110 - 207 |
Cookie | Minerals_Potassium | IQR | 97 |
Cookie | Minerals_Potassium | мин. - макс. | 39 - 504 |
Cookie | Minerals_Potassium | CI | 152.97 - 188.41 |
Cookie | Minerals_Sodium | Количество значений | 100 |
Cookie | Minerals_Sodium | Количество пропущенных значений | 0 |
Cookie | Minerals_Sodium | Среднее значение | 336.08 |
Cookie | Minerals_Sodium | Медиана | 350 |
Cookie | Minerals_Sodium | Станд. отклон. | 123.71 |
Cookie | Minerals_Sodium | Q1 - Q3 | 256.75 - 403.75 |
Cookie | Minerals_Sodium | IQR | 147 |
Cookie | Minerals_Sodium | мин. - макс. | 9 - 580 |
Cookie | Minerals_Sodium | CI | 311.83 - 360.33 |
Cookie | Minerals_Zinc | Количество значений | 100 |
Cookie | Minerals_Zinc | Количество пропущенных значений | 0 |
Cookie | Minerals_Zinc | Среднее значение | 0.64 |
Cookie | Minerals_Zinc | Медиана | 0.63 |
Cookie | Minerals_Zinc | Станд. отклон. | 0.29 |
Cookie | Minerals_Zinc | Q1 - Q3 | 0.45 - 0.75 |
Cookie | Minerals_Zinc | IQR | 0.3 |
Cookie | Minerals_Zinc | мин. - макс. | 0.03 - 1.6 |
Cookie | Minerals_Zinc | CI | 0.58 - 0.69 |
Cookie | Vitamin_A_RAE | Количество значений | 100 |
Cookie | Vitamin_A_RAE | Количество пропущенных значений | 0 |
Cookie | Vitamin_A_RAE | Среднее значение | 21.96 |
Cookie | Vitamin_A_RAE | Медиана | 1 |
Cookie | Vitamin_A_RAE | Станд. отклон. | 58.92 |
Cookie | Vitamin_A_RAE | Q1 - Q3 | 0 - 8 |
Cookie | Vitamin_A_RAE | IQR | 8 |
Cookie | Vitamin_A_RAE | мин. - макс. | 0 - 270 |
Cookie | Vitamin_A_RAE | CI | 10.41 - 33.51 |
Cookie | Vitamin_B12 | Количество значений | 100 |
Cookie | Vitamin_B12 | Количество пропущенных значений | 0 |
Cookie | Vitamin_B12 | Среднее значение | 0.06 |
Cookie | Vitamin_B12 | Медиана | 0.01 |
Cookie | Vitamin_B12 | Станд. отклон. | 0.11 |
Cookie | Vitamin_B12 | Q1 - Q3 | 0 - 0.07 |
Cookie | Vitamin_B12 | IQR | 0.07 |
Cookie | Vitamin_B12 | мин. - макс. | 0 - 0.75 |
Cookie | Vitamin_B12 | CI | 0.04 - 0.08 |
Cookie | Vitamin_B6 | Количество значений | 100 |
Cookie | Vitamin_B6 | Количество пропущенных значений | 0 |
Cookie | Vitamin_B6 | Среднее значение | 0.16 |
Cookie | Vitamin_B6 | Медиана | 0.06 |
Cookie | Vitamin_B6 | Станд. отклон. | 0.61 |
Cookie | Vitamin_B6 | Q1 - Q3 | 0.03 - 0.09 |
Cookie | Vitamin_B6 | IQR | 0.07 |
Cookie | Vitamin_B6 | мин. - макс. | 0 - 5.9 |
Cookie | Vitamin_B6 | CI | 0.04 - 0.28 |
Cookie | Vitamin_C | Количество значений | 100 |
Cookie | Vitamin_C | Количество пропущенных значений | 0 |
Cookie | Vitamin_C | Среднее значение | 0.34 |
Cookie | Vitamin_C | Медиана | 0 |
Cookie | Vitamin_C | Станд. отклон. | 1.24 |
Cookie | Vitamin_C | Q1 - Q3 | 0 - 0.1 |
Cookie | Vitamin_C | IQR | 0.1 |
Cookie | Vitamin_C | мин. - макс. | 0 - 9.1 |
Cookie | Vitamin_C | CI | 0.1 - 0.58 |
Cookie | Vitamin_E | Количество значений | 100 |
Cookie | Vitamin_E | Количество пропущенных значений | 0 |
Cookie | Vitamin_E | Среднее значение | 1.31 |
Cookie | Vitamin_E | Медиана | 1.08 |
Cookie | Vitamin_E | Станд. отклон. | 1.02 |
Cookie | Vitamin_E | Q1 - Q3 | 0.26 - 2.12 |
Cookie | Vitamin_E | IQR | 1.86 |
Cookie | Vitamin_E | мин. - макс. | 0 - 4.32 |
Cookie | Vitamin_E | CI | 1.11 - 1.51 |
Cookie | Vitamin_K | Количество значений | 100 |
Cookie | Vitamin_K | Количество пропущенных значений | 0 |
Cookie | Vitamin_K | Среднее значение | 8.41 |
Cookie | Vitamin_K | Медиана | 5.85 |
Cookie | Vitamin_K | Станд. отклон. | 8.73 |
Cookie | Vitamin_K | Q1 - Q3 | 3.8 - 8 |
Cookie | Vitamin_K | IQR | 4.2 |
Cookie | Vitamin_K | мин. - макс. | 0 - 34.8 |
Cookie | Vitamin_K | CI | 6.7 - 10.13 |
Rice | Alpha_Carotene | Количество значений | 143 |
Rice | Alpha_Carotene | Количество пропущенных значений | 0 |
Rice | Alpha_Carotene | Среднее значение | 125.06 |
Rice | Alpha_Carotene | Медиана | 4 |
Rice | Alpha_Carotene | Станд. отклон. | 211.16 |
Rice | Alpha_Carotene | Q1 - Q3 | 0 - 193 |
Rice | Alpha_Carotene | IQR | 193 |
Rice | Alpha_Carotene | мин. - макс. | 0 - 926 |
Rice | Alpha_Carotene | CI | 90.45 - 159.67 |
Rice | Beta_Carotene | Количество значений | 143 |
Rice | Beta_Carotene | Количество пропущенных значений | 0 |
Rice | Beta_Carotene | Среднее значение | 310.92 |
Rice | Beta_Carotene | Медиана | 74 |
Rice | Beta_Carotene | Станд. отклон. | 469.49 |
Rice | Beta_Carotene | Q1 - Q3 | 6 - 415 |
Rice | Beta_Carotene | IQR | 409 |
Rice | Beta_Carotene | мин. - макс. | 0 - 2044 |
Rice | Beta_Carotene | CI | 233.97 - 387.87 |
Rice | Beta_Cryptoxanthin | Количество значений | 143 |
Rice | Beta_Cryptoxanthin | Количество пропущенных значений | 0 |
Rice | Beta_Cryptoxanthin | Среднее значение | 1.25 |
Rice | Beta_Cryptoxanthin | Медиана | 0 |
Rice | Beta_Cryptoxanthin | Станд. отклон. | 5.79 |
Rice | Beta_Cryptoxanthin | Q1 - Q3 | 0 - 0 |
Rice | Beta_Cryptoxanthin | IQR | 0 |
Rice | Beta_Cryptoxanthin | мин. - макс. | 0 - 31 |
Rice | Beta_Cryptoxanthin | CI | 0.3 - 2.2 |
Rice | Carbohydrate | Количество значений | 143 |
Rice | Carbohydrate | Количество пропущенных значений | 0 |
Rice | Carbohydrate | Среднее значение | 21.95 |
Rice | Carbohydrate | Медиана | 21.36 |
Rice | Carbohydrate | Станд. отклон. | 3.21 |
Rice | Carbohydrate | Q1 - Q3 | 19.82 - 23.22 |
Rice | Carbohydrate | IQR | 3.4 |
Rice | Carbohydrate | мин. - макс. | 15.03 - 32.5 |
Rice | Carbohydrate | CI | 21.42 - 22.47 |
Rice | Cholesterol | Количество значений | 143 |
Rice | Cholesterol | Количество пропущенных значений | 0 |
Rice | Cholesterol | Среднее значение | 2.51 |
Rice | Cholesterol | Медиана | 0 |
Rice | Cholesterol | Станд. отклон. | 6.65 |
Rice | Cholesterol | Q1 - Q3 | 0 - 1 |
Rice | Cholesterol | IQR | 1 |
Rice | Cholesterol | мин. - макс. | 0 - 47 |
Rice | Cholesterol | CI | 1.42 - 3.6 |
Rice | Choline | Количество значений | 143 |
Rice | Choline | Количество пропущенных значений | 0 |
Rice | Choline | Среднее значение | 7.63 |
Rice | Choline | Медиана | 7.6 |
Rice | Choline | Станд. отклон. | 4.22 |
Rice | Choline | Q1 - Q3 | 3.8 - 9.9 |
Rice | Choline | IQR | 6.1 |
Rice | Choline | мин. - макс. | 1.1 - 25 |
Rice | Choline | CI | 6.93 - 8.32 |
Rice | Fiber | Количество значений | 143 |
Rice | Fiber | Количество пропущенных значений | 0 |
Rice | Fiber | Среднее значение | 1.24 |
Rice | Fiber | Медиана | 1.1 |
Rice | Fiber | Станд. отклон. | 0.7 |
Rice | Fiber | Q1 - Q3 | 0.9 - 1.7 |
Rice | Fiber | IQR | 0.8 |
Rice | Fiber | мин. - макс. | 0.1 - 4.3 |
Rice | Fiber | CI | 1.13 - 1.35 |
Rice | Lutein_and_Zeaxanthin | Количество значений | 143 |
Rice | Lutein_and_Zeaxanthin | Количество пропущенных значений | 0 |
Rice | Lutein_and_Zeaxanthin | Среднее значение | 115.45 |
Rice | Lutein_and_Zeaxanthin | Медиана | 88 |
Rice | Lutein_and_Zeaxanthin | Станд. отклон. | 134.62 |
Rice | Lutein_and_Zeaxanthin | Q1 - Q3 | 0 - 165 |
Rice | Lutein_and_Zeaxanthin | IQR | 165 |
Rice | Lutein_and_Zeaxanthin | мин. - макс. | 0 - 600 |
Rice | Lutein_and_Zeaxanthin | CI | 93.38 - 137.51 |
Rice | Lycopene | Количество значений | 143 |
Rice | Lycopene | Количество пропущенных значений | 0 |
Rice | Lycopene | Среднее значение | 79.46 |
Rice | Lycopene | Медиана | 0 |
Rice | Lycopene | Станд. отклон. | 193.81 |
Rice | Lycopene | Q1 - Q3 | 0 - 0 |
Rice | Lycopene | IQR | 0 |
Rice | Lycopene | мин. - макс. | 0 - 849 |
Rice | Lycopene | CI | 47.7 - 111.23 |
Rice | Niacin | Количество значений | 143 |
Rice | Niacin | Количество пропущенных значений | 0 |
Rice | Niacin | Среднее значение | 1.56 |
Rice | Niacin | Медиана | 1.43 |
Rice | Niacin | Станд. отклон. | 0.49 |
Rice | Niacin | Q1 - Q3 | 1.21 - 2.04 |
Rice | Niacin | IQR | 0.83 |
Rice | Niacin | мин. - макс. | 0.29 - 2.55 |
Rice | Niacin | CI | 1.48 - 1.64 |
Rice | Protein | Количество значений | 143 |
Rice | Protein | Количество пропущенных значений | 0 |
Rice | Protein | Среднее значение | 2.89 |
Rice | Protein | Медиана | 2.47 |
Rice | Protein | Станд. отклон. | 1.2 |
Rice | Protein | Q1 - Q3 | 2.2 - 2.8 |
Rice | Protein | IQR | 0.59 |
Rice | Protein | мин. - макс. | 1.16 - 7.86 |
Rice | Protein | CI | 2.7 - 3.09 |
Rice | Retinol | Количество значений | 143 |
Rice | Retinol | Количество пропущенных значений | 0 |
Rice | Retinol | Среднее значение | 4.69 |
Rice | Retinol | Медиана | 0 |
Rice | Retinol | Станд. отклон. | 10.62 |
Rice | Retinol | Q1 - Q3 | 0 - 0 |
Rice | Retinol | IQR | 0 |
Rice | Retinol | мин. - макс. | 0 - 71 |
Rice | Retinol | CI | 2.95 - 6.43 |
Rice | Riboflavin | Количество значений | 143 |
Rice | Riboflavin | Количество пропущенных значений | 0 |
Rice | Riboflavin | Среднее значение | 0.05 |
Rice | Riboflavin | Медиана | 0.05 |
Rice | Riboflavin | Станд. отклон. | 0.03 |
Rice | Riboflavin | Q1 - Q3 | 0.03 - 0.07 |
Rice | Riboflavin | IQR | 0.04 |
Rice | Riboflavin | мин. - макс. | 0.01 - 0.16 |
Rice | Riboflavin | CI | 0.05 - 0.06 |
Rice | Selenium | Количество значений | 143 |
Rice | Selenium | Количество пропущенных значений | 0 |
Rice | Selenium | Среднее значение | 5.28 |
Rice | Selenium | Медиана | 5.1 |
Rice | Selenium | Станд. отклон. | 1.74 |
Rice | Selenium | Q1 - Q3 | 4.45 - 5.7 |
Rice | Selenium | IQR | 1.25 |
Rice | Selenium | мин. - макс. | 0.8 - 14.5 |
Rice | Selenium | CI | 5 - 5.57 |
Rice | Sugar_Total | Количество значений | 143 |
Rice | Sugar_Total | Количество пропущенных значений | 0 |
Rice | Sugar_Total | Среднее значение | 0.87 |
Rice | Sugar_Total | Медиана | 0.74 |
Rice | Sugar_Total | Станд. отклон. | 1 |
Rice | Sugar_Total | Q1 - Q3 | 0.38 - 0.98 |
Rice | Sugar_Total | IQR | 0.6 |
Rice | Sugar_Total | мин. - макс. | 0.05 - 8.76 |
Rice | Sugar_Total | CI | 0.7 - 1.03 |
Rice | Thiamin | Количество значений | 143 |
Rice | Thiamin | Количество пропущенных значений | 0 |
Rice | Thiamin | Среднее значение | 0.15 |
Rice | Thiamin | Медиана | 0.14 |
Rice | Thiamin | Станд. отклон. | 0.05 |
Rice | Thiamin | Q1 - Q3 | 0.12 - 0.17 |
Rice | Thiamin | IQR | 0.05 |
Rice | Thiamin | мин. - макс. | 0.01 - 0.3 |
Rice | Thiamin | CI | 0.14 - 0.16 |
Rice | Water | Количество значений | 143 |
Rice | Water | Количество пропущенных значений | 0 |
Rice | Water | Среднее значение | 71.72 |
Rice | Water | Медиана | 72.59 |
Rice | Water | Станд. отклон. | 4.62 |
Rice | Water | Q1 - Q3 | 69.8 - 74.48 |
Rice | Water | IQR | 4.68 |
Rice | Water | мин. - макс. | 51.52 - 83.14 |
Rice | Water | CI | 70.97 - 72.48 |
Rice | Monosaturated_Fat | Количество значений | 143 |
Rice | Monosaturated_Fat | Количество пропущенных значений | 0 |
Rice | Monosaturated_Fat | Среднее значение | 0.84 |
Rice | Monosaturated_Fat | Медиана | 0.96 |
Rice | Monosaturated_Fat | Станд. отклон. | 0.56 |
Rice | Monosaturated_Fat | Q1 - Q3 | 0.32 - 1.06 |
Rice | Monosaturated_Fat | IQR | 0.74 |
Rice | Monosaturated_Fat | мин. - макс. | 0.03 - 2.61 |
Rice | Monosaturated_Fat | CI | 0.75 - 0.93 |
Rice | Polysaturated_Fat | Количество значений | 143 |
Rice | Polysaturated_Fat | Количество пропущенных значений | 0 |
Rice | Polysaturated_Fat | Среднее значение | 0.73 |
Rice | Polysaturated_Fat | Медиана | 0.91 |
Rice | Polysaturated_Fat | Станд. отклон. | 0.46 |
Rice | Polysaturated_Fat | Q1 - Q3 | 0.3 - 1.05 |
Rice | Polysaturated_Fat | IQR | 0.75 |
Rice | Polysaturated_Fat | мин. - макс. | 0.03 - 2.56 |
Rice | Polysaturated_Fat | CI | 0.66 - 0.81 |
Rice | Saturated_Fat | Количество значений | 143 |
Rice | Saturated_Fat | Количество пропущенных значений | 0 |
Rice | Saturated_Fat | Среднее значение | 0.68 |
Rice | Saturated_Fat | Медиана | 0.41 |
Rice | Saturated_Fat | Станд. отклон. | 1.38 |
Rice | Saturated_Fat | Q1 - Q3 | 0.23 - 0.5 |
Rice | Saturated_Fat | IQR | 0.27 |
Rice | Saturated_Fat | мин. - макс. | 0.03 - 15.17 |
Rice | Saturated_Fat | CI | 0.45 - 0.91 |
Rice | Total_Lipid | Количество значений | 143 |
Rice | Total_Lipid | Количество пропущенных значений | 0 |
Rice | Total_Lipid | Среднее значение | 2.4 |
Rice | Total_Lipid | Медиана | 2.42 |
Rice | Total_Lipid | Станд. отклон. | 1.98 |
Rice | Total_Lipid | Q1 - Q3 | 0.89 - 2.71 |
Rice | Total_Lipid | IQR | 1.82 |
Rice | Total_Lipid | мин. - макс. | 0.09 - 17.23 |
Rice | Total_Lipid | CI | 2.08 - 2.72 |
Rice | Minerals_Calcium | Количество значений | 143 |
Rice | Minerals_Calcium | Количество пропущенных значений | 0 |
Rice | Minerals_Calcium | Среднее значение | 19.69 |
Rice | Minerals_Calcium | Медиана | 11 |
Rice | Minerals_Calcium | Станд. отклон. | 27.38 |
Rice | Minerals_Calcium | Q1 - Q3 | 8 - 16.5 |
Rice | Minerals_Calcium | IQR | 8.5 |
Rice | Minerals_Calcium | мин. - макс. | 2 - 133 |
Rice | Minerals_Calcium | CI | 15.2 - 24.18 |
Rice | Minerals_Copper | Количество значений | 143 |
Rice | Minerals_Copper | Количество пропущенных значений | 0 |
Rice | Minerals_Copper | Среднее значение | 0.08 |
Rice | Minerals_Copper | Медиана | 0.08 |
Rice | Minerals_Copper | Станд. отклон. | 0.03 |
Rice | Minerals_Copper | Q1 - Q3 | 0.06 - 0.09 |
Rice | Minerals_Copper | IQR | 0.03 |
Rice | Minerals_Copper | мин. - макс. | 0.03 - 0.25 |
Rice | Minerals_Copper | CI | 0.07 - 0.08 |
Rice | Minerals_Iron | Количество значений | 143 |
Rice | Minerals_Iron | Количество пропущенных значений | 0 |
Rice | Minerals_Iron | Среднее значение | 0.92 |
Rice | Minerals_Iron | Медиана | 0.81 |
Rice | Minerals_Iron | Станд. отклон. | 0.77 |
Rice | Minerals_Iron | Q1 - Q3 | 0.55 - 1 |
Rice | Minerals_Iron | IQR | 0.45 |
Rice | Minerals_Iron | мин. - макс. | 0.14 - 5.01 |
Rice | Minerals_Iron | CI | 0.79 - 1.04 |
Rice | Minerals_Magnesium | Количество значений | 143 |
Rice | Minerals_Magnesium | Количество пропущенных значений | 0 |
Rice | Minerals_Magnesium | Среднее значение | 21.45 |
Rice | Minerals_Magnesium | Медиана | 16 |
Rice | Minerals_Magnesium | Станд. отклон. | 10.55 |
Rice | Minerals_Magnesium | Q1 - Q3 | 12 - 32 |
Rice | Minerals_Magnesium | IQR | 20 |
Rice | Minerals_Magnesium | мин. - макс. | 5 - 39 |
Rice | Minerals_Magnesium | CI | 19.73 - 23.18 |
Rice | Minerals_Phosphorus | Количество значений | 143 |
Rice | Minerals_Phosphorus | Количество пропущенных значений | 0 |
Rice | Minerals_Phosphorus | Среднее значение | 68.73 |
Rice | Minerals_Phosphorus | Медиана | 74 |
Rice | Minerals_Phosphorus | Станд. отклон. | 29.22 |
Rice | Minerals_Phosphorus | Q1 - Q3 | 41 - 91.5 |
Rice | Minerals_Phosphorus | IQR | 50.5 |
Rice | Minerals_Phosphorus | мин. - макс. | 8 - 139 |
Rice | Minerals_Phosphorus | CI | 63.94 - 73.52 |
Rice | Minerals_Potassium | Количество значений | 143 |
Rice | Minerals_Potassium | Количество пропущенных значений | 0 |
Rice | Minerals_Potassium | Среднее значение | 87.96 |
Rice | Minerals_Potassium | Медиана | 87 |
Rice | Minerals_Potassium | Станд. отклон. | 37.09 |
Rice | Minerals_Potassium | Q1 - Q3 | 69 - 105.5 |
Rice | Minerals_Potassium | IQR | 36.5 |
Rice | Minerals_Potassium | мин. - макс. | 10 - 219 |
Rice | Minerals_Potassium | CI | 81.88 - 94.04 |
Rice | Minerals_Sodium | Количество значений | 143 |
Rice | Minerals_Sodium | Количество пропущенных значений | 0 |
Rice | Minerals_Sodium | Среднее значение | 238.12 |
Rice | Minerals_Sodium | Медиана | 201 |
Rice | Minerals_Sodium | Станд. отклон. | 91.79 |
Rice | Minerals_Sodium | Q1 - Q3 | 178 - 265 |
Rice | Minerals_Sodium | IQR | 87 |
Rice | Minerals_Sodium | мин. - макс. | 69 - 510 |
Rice | Minerals_Sodium | CI | 223.07 - 253.16 |
Rice | Minerals_Zinc | Количество значений | 143 |
Rice | Minerals_Zinc | Количество пропущенных значений | 0 |
Rice | Minerals_Zinc | Среднее значение | 0.57 |
Rice | Minerals_Zinc | Медиана | 0.52 |
Rice | Minerals_Zinc | Станд. отклон. | 0.2 |
Rice | Minerals_Zinc | Q1 - Q3 | 0.43 - 0.69 |
Rice | Minerals_Zinc | IQR | 0.26 |
Rice | Minerals_Zinc | мин. - макс. | 0.22 - 1.37 |
Rice | Minerals_Zinc | CI | 0.54 - 0.6 |
Rice | Vitamin_A_RAE | Количество значений | 143 |
Rice | Vitamin_A_RAE | Количество пропущенных значений | 0 |
Rice | Vitamin_A_RAE | Среднее значение | 35.92 |
Rice | Vitamin_A_RAE | Медиана | 20 |
Rice | Vitamin_A_RAE | Станд. отклон. | 46.89 |
Rice | Vitamin_A_RAE | Q1 - Q3 | 2.5 - 57.5 |
Rice | Vitamin_A_RAE | IQR | 55 |
Rice | Vitamin_A_RAE | мин. - макс. | 0 - 209 |
Rice | Vitamin_A_RAE | CI | 28.23 - 43.6 |
Rice | Vitamin_B12 | Количество значений | 143 |
Rice | Vitamin_B12 | Количество пропущенных значений | 0 |
Rice | Vitamin_B12 | Среднее значение | 0.02 |
Rice | Vitamin_B12 | Медиана | 0 |
Rice | Vitamin_B12 | Станд. отклон. | 0.07 |
Rice | Vitamin_B12 | Q1 - Q3 | 0 - 0 |
Rice | Vitamin_B12 | IQR | 0 |
Rice | Vitamin_B12 | мин. - макс. | 0 - 0.52 |
Rice | Vitamin_B12 | CI | 0.01 - 0.03 |
Rice | Vitamin_B6 | Количество значений | 143 |
Rice | Vitamin_B6 | Количество пропущенных значений | 0 |
Rice | Vitamin_B6 | Среднее значение | 0.1 |
Rice | Vitamin_B6 | Медиана | 0.1 |
Rice | Vitamin_B6 | Станд. отклон. | 0.03 |
Rice | Vitamin_B6 | Q1 - Q3 | 0.09 - 0.12 |
Rice | Vitamin_B6 | IQR | 0.03 |
Rice | Vitamin_B6 | мин. - макс. | 0.03 - 0.18 |
Rice | Vitamin_B6 | CI | 0.09 - 0.1 |
Rice | Vitamin_C | Количество значений | 143 |
Rice | Vitamin_C | Количество пропущенных значений | 0 |
Rice | Vitamin_C | Среднее значение | 2.9 |
Rice | Vitamin_C | Медиана | 0.8 |
Rice | Vitamin_C | Станд. отклон. | 4.37 |
Rice | Vitamin_C | Q1 - Q3 | 0 - 3.6 |
Rice | Vitamin_C | IQR | 3.6 |
Rice | Vitamin_C | мин. - макс. | 0 - 19.5 |
Rice | Vitamin_C | CI | 2.19 - 3.62 |
Rice | Vitamin_E | Количество значений | 143 |
Rice | Vitamin_E | Количество пропущенных значений | 0 |
Rice | Vitamin_E | Среднее значение | 0.31 |
Rice | Vitamin_E | Медиана | 0.3 |
Rice | Vitamin_E | Станд. отклон. | 0.16 |
Rice | Vitamin_E | Q1 - Q3 | 0.18 - 0.44 |
Rice | Vitamin_E | IQR | 0.26 |
Rice | Vitamin_E | мин. - макс. | 0.02 - 0.75 |
Rice | Vitamin_E | CI | 0.29 - 0.34 |
Rice | Vitamin_K | Количество значений | 143 |
Rice | Vitamin_K | Количество пропущенных значений | 0 |
Rice | Vitamin_K | Среднее значение | 5.45 |
Rice | Vitamin_K | Медиана | 3.7 |
Rice | Vitamin_K | Станд. отклон. | 5.79 |
Rice | Vitamin_K | Q1 - Q3 | 2.3 - 6.7 |
Rice | Vitamin_K | IQR | 4.4 |
Rice | Vitamin_K | мин. - макс. | 0 - 28.1 |
Rice | Vitamin_K | CI | 4.5 - 6.4 |
1.1) Абсолютное количество;
1.2) Относительное количество внутри группы;
1.3) 95% ДИ для доли внутри группы - задание со звёздочкой.
# нет категориальных переменных подходящих для анализа
Для каждой количественной переменной сделайте боксплоты по группам. Расположите их либо на отдельных рисунках, либо на одном, но читаемо;
Наложите на боксплоты beeplots - задание со звёздочкой.
Раскрасьте боксплоты с помощью библиотеки RColorBrewer.
theme_custom <- theme(
panel.background = element_rect(fill = "white"),
plot.title = element_text(size = 18, hjust = 0.5),
plot.subtitle = element_text(size = 16, hjust = 0.5),
strip.text = element_text(size = 16),
axis.text = element_text(size = 16),
axis.title = element_text(size = 18),
legend.title = element_text(size = 16),
legend.text = element_text(size = 16 ),
legend.position = "right"
)
# c использованием базового R (первый вариант)
lapply(seq_along(cleaned_data)[sapply (cleaned_data, is.numeric)], function(i) {
y<-cleaned_data[[i]]
ggplot(cleaned_data, aes (x = Category, y = y, fill = Category))+
geom_boxplot(outliers = F) +
geom_beeswarm(size = 1.5, cex = 1, alpha = 0.3) +
theme_custom +
scale_fill_brewer(palette = "Accent") +
labs(y = "Value", title = paste0("Boxplot: ", colnames(cleaned_data)[[i]]))
})
## [[1]]
##
## [[2]]
##
## [[3]]
##
## [[4]]
##
## [[5]]
##
## [[6]]
##
## [[7]]
##
## [[8]]
##
## [[9]]
##
## [[10]]
##
## [[11]]
##
## [[12]]
##
## [[13]]
##
## [[14]]
##
## [[15]]
##
## [[16]]
##
## [[17]]
##
## [[18]]
##
## [[19]]
##
## [[20]]
##
## [[21]]
##
## [[22]]
##
## [[23]]
##
## [[24]]
##
## [[25]]
##
## [[26]]
##
## [[27]]
##
## [[28]]
##
## [[29]]
##
## [[30]]
##
## [[31]]
##
## [[32]]
##
## [[33]]
##
## [[34]]
##
## [[35]]
make_qqplot <- function(data, var) {
data %>%
ggplot() +
aes(x = Category, y = !!as.name(var), fill = Category) +
geom_boxplot(width = 0.2, notch = FALSE, position = position_dodge(1), lwd = 1, outlier.shape = NA)+
scale_fill_brewer(palette = "Accent") +
geom_beeswarm(size = 1.5, cex = 1, alpha = 0.3) +
theme_custom
}
vars <- cleaned_data %>% select(where(is.numeric)) %>% names ()
plots <- map(vars, ~ make_qqplot(cleaned_data, .x))
plots
## [[1]]
##
## [[2]]
##
## [[3]]
##
## [[4]]
##
## [[5]]
##
## [[6]]
##
## [[7]]
##
## [[8]]
##
## [[9]]
##
## [[10]]
##
## [[11]]
##
## [[12]]
##
## [[13]]
##
## [[14]]
##
## [[15]]
##
## [[16]]
##
## [[17]]
##
## [[18]]
##
## [[19]]
##
## [[20]]
##
## [[21]]
##
## [[22]]
##
## [[23]]
##
## [[24]]
##
## [[25]]
##
## [[26]]
##
## [[27]]
##
## [[28]]
##
## [[29]]
##
## [[30]]
##
## [[31]]
##
## [[32]]
##
## [[33]]
##
## [[34]]
##
## [[35]]
# нет подходящих категориальных переменных
Для теста Шапиро-Уилка:
Н0- выборка получена из нормального распределения (данные согласуются с
нормальным распределением)
Н1- выборка получена из распределения, отличного от нормального
Т.к. значения p- value гораздо меньше порогового знаения (0.05), можем
отвергнуть Н0 и сделать вывод, что все количественные данные в датасете
не согласуются с нормальным распределением.
normality<-cleaned_data %>%
select(where (is.numeric))%>%
summarise_all( list(statistic = ~shapiro.test(.x)$statistic ,
p.value = ~shapiro.test(.x)$p.value)) %>%
pivot_longer (everything()) %>%
separate (name, into = c ("Переменная", "Статистика"), sep= "_(?!.*_)") %>%
filter (`Статистика` == "p.value") %>% select (!`Статистика`) %>%
rename (`p-value` = value) %>%
mutate (`Нормальность (тест Шапиро-Уилка)` = ifelse (`p-value` > 0.05, "Да", "Нет" )) %>%
flextable() %>%
set_formatter(`p-value` = function(x) {
formatC(x, format = "e", digits = 2)
})
normality
Переменная | p-value | Нормальность (тест Шапиро-Уилка) |
|---|---|---|
Alpha_Carotene | 9.68e-26 | Нет |
Beta_Carotene | 1.72e-24 | Нет |
Beta_Cryptoxanthin | 4.18e-31 | Нет |
Carbohydrate | 8.23e-18 | Нет |
Cholesterol | 1.48e-29 | Нет |
Choline | 4.02e-21 | Нет |
Fiber | 5.20e-23 | Нет |
Lutein_and_Zeaxanthin | 1.25e-20 | Нет |
Lycopene | 1.06e-28 | Нет |
Niacin | 4.67e-23 | Нет |
Protein | 3.30e-15 | Нет |
Retinol | 2.62e-29 | Нет |
Riboflavin | 1.21e-27 | Нет |
Selenium | 1.03e-18 | Нет |
Sugar_Total | 7.34e-19 | Нет |
Thiamin | 1.30e-20 | Нет |
Water | 3.05e-19 | Нет |
Monosaturated_Fat | 2.95e-17 | Нет |
Polysaturated_Fat | 2.38e-18 | Нет |
Saturated_Fat | 1.38e-20 | Нет |
Total_Lipid | 4.49e-16 | Нет |
Minerals_Calcium | 5.17e-21 | Нет |
Minerals_Copper | 2.19e-18 | Нет |
Minerals_Iron | 1.65e-19 | Нет |
Minerals_Magnesium | 2.39e-13 | Нет |
Minerals_Phosphorus | 6.01e-11 | Нет |
Minerals_Potassium | 2.45e-15 | Нет |
Minerals_Sodium | 6.83e-08 | Нет |
Minerals_Zinc | 1.58e-10 | Нет |
Vitamin_A_RAE | 1.19e-22 | Нет |
Vitamin_B12 | 2.36e-26 | Нет |
Vitamin_B6 | 8.86e-32 | Нет |
Vitamin_C | 3.83e-24 | Нет |
Vitamin_E | 2.49e-19 | Нет |
Vitamin_K | 3.14e-19 | Нет |
lapply(seq_along(cleaned_data)[4:9], function(i) {
dat<-cleaned_data[[i]]
ggplot(cleaned_data, aes(sample = dat)) +
geom_qq() +
geom_qq_line() +
#scale_color_manual(values = c("brown", "#E7B800"))+
labs(y = "sample quantiles", x = "theoretical quantiles", title = paste0("QQ-plot: ",colnames(cleaned_data)[[i]]))+
theme_custom
})
## [[1]]
##
## [[2]]
##
## [[3]]
##
## [[4]]
##
## [[5]]
##
## [[6]]
# https://www.cedricscherer.com/2023/07/05/efficiency-and-consistency-automate-subset-graphics-with-ggplot2-and-purrr/
Результаты не отличаются от теста на нормальное распределение, если
проводить сравнение без разделения на группы (категории). В данном
случае выборки достаточно большие, поэтому больше подходит QQ-
plot.
В целом графические методы более предпочтительны.
Результат тест Шапиро- Уилка очень зависит от объема выборки, и рекомендуется для относительно небольших выборок (до 50). Выборки разного размера из одной популяции могут давать совершенно разные резульаты теста. При больших выборках небольшие отклонения от нормального распределния могут привести к ложному отвержению нулевой гипотезы.
При разбиении на категории, графики некоторых величин, становятся
более согласованными с нормальным распределением
Другие методы оценки нормальности
Есть еще аналитические тесты например Колмогорова-Смирного и
Андерсона- Дарлинга, но считается что их мощность ниже чем теста
Шапиро-Уилка.
Кроме того, используются такие характеристики как skewness (симметрия)
and kurtosis (коэффициент эксцесса, мера остроконечности пика
распределения величины). Недостатками этих моделей является то, что для
них нет строгих критериев, какие значения параметра считать пороговыми
для принятия решения о нормальности. Эти оценки также не заменяют
построенеи QQ- plot (или гистограмм).
cleaned_data %>% group_by(Category)%>% tally()
cleaned_data %>%
select(where(is.numeric)) %>%
names() %>%
set_names() %>%
map(function(x) t.test(cleaned_data[[x]] ~ cleaned_data$Category)$p.value < 0.05) %>%
enframe() %>%
unnest()
## Warning: `cols` is now required when using `unnest()`.
## ℹ Please use `cols = c(value)`.
Комментарий:
Для сравнения групп выбираем t-test для количественных переменных, так как объем выборки 100 измерений для категории “Cookie” и 143 для категории “Rice” позволяет нам использовать свойство нормализации средних значений, что позволяет не учитывать данные о нормальности рапределений в генеральной совокупности. В таком случае основной критерий - независимость значений переменных.
Н0 - средние значения переменной в группе 1 РАВНЫ среднему значению
по данной переменной в группе 2
Н1 - средние значения переменной в группе 1 НЕ РАВНЫ среднему значению
по данной переменной в группе 2
При значении p-value меньше порогового (0,05) Н0 отвергаем
В принципе непараметрический тест Манн-Уитни дает нам почти такие же
результаты, за исключением результата для Сholosterol.
Так как t-test Cтьюдента обладает большей мощностью по сравнению с
непараметрическим тестом Манна-Уитни (Wilcoxon test), в данном случае
лучше выбрать его.
require(psych)
require (corrplot)
correlation <- psych::corr.test(cleaned_data[, c(4:38)],method = "spearman", adjust = "fdr") # c поправкой на множ. сравнения
corrplot(corr = correlation$r, # график для коэффициента корреляции
method = "color",
order = "hclust")
#correlation$p #значения p- value
Корреляционный анализ используется для первичной “экслораторной” оценки данных с целью выявить возможные взаимосвязь между переменными и обозначить дальнейшие направления поиска. Позволяет оценить сразу много переменных.
Недостатком является то, что метод не позволяет анализировать
качественные переменные (ковариация и как следствие кореляция могут быть
осмысленно посчитаны только между количественными переменными.
Наличие корреляции не позволяет сделать вывод о наличии
причинно-следственной связи, но помогает в дизайне исследований которые
могут доказать причино-следственную связь. Также метод чувствителен к
выбросам, и способен выявить лишь линейную взаимосвязь.
require (corrplot)
# вариант визуализации корреляционной матрицы с помощью corrplot, где крестиком отмечены незначимые различия по уровню p-value для части переменных
nums<-cleaned_data[,c(4:14)]
mat <- corr.test(nums,method = "spearman", adjust = "fdr")
res1 <- corrplot::cor.mtest(nums, conf.level = .95) ## specialized the insignificant value according to the significant level (0,05)
corrplot(mat$r, p.mat = res1$p) ## is significant level, with default value 0.05.
cleaned_data %>% group_by(Category) %>%summarise_if(is.numeric, mean, na.rm = TRUE)
colnames(cleaned_data)
## [1] "Category" "Description" "Nutrient_Bank_Number"
## [4] "Alpha_Carotene" "Beta_Carotene" "Beta_Cryptoxanthin"
## [7] "Carbohydrate" "Cholesterol" "Choline"
## [10] "Fiber" "Lutein_and_Zeaxanthin" "Lycopene"
## [13] "Niacin" "Protein" "Retinol"
## [16] "Riboflavin" "Selenium" "Sugar_Total"
## [19] "Thiamin" "Water" "Monosaturated_Fat"
## [22] "Polysaturated_Fat" "Saturated_Fat" "Total_Lipid"
## [25] "Minerals_Calcium" "Minerals_Copper" "Minerals_Iron"
## [28] "Minerals_Magnesium" "Minerals_Phosphorus" "Minerals_Potassium"
## [31] "Minerals_Sodium" "Minerals_Zinc" "Vitamin_A_RAE"
## [34] "Vitamin_B12" "Vitamin_B6" "Vitamin_C"
## [37] "Vitamin_E" "Vitamin_K"
cleaned_data$Category <- as.factor(cleaned_data$Category)
# для примера возьмем некоторые переменные.
# Так как модель предсказывает категориальную переменную- то выбираем GLM
fit <- glm(Category ~ `Beta_Carotene` + `Lycopene`+ `Total_Lipid`+ `Choline`, cleaned_data, family = "binomial")
## Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
# выводим результат модели
summary(fit)
##
## Call:
## glm(formula = Category ~ Beta_Carotene + Lycopene + Total_Lipid +
## Choline, family = "binomial", data = cleaned_data)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 5.006241 0.869402 5.758 8.50e-09 ***
## Beta_Carotene 0.003598 0.001740 2.068 0.0387 *
## Lycopene 1.650499 2.092589 0.789 0.4303
## Total_Lipid -0.586449 0.104758 -5.598 2.17e-08 ***
## Choline -0.123520 0.053859 -2.293 0.0218 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 329.220 on 242 degrees of freedom
## Residual deviance: 65.937 on 238 degrees of freedom
## AIC: 75.937
##
## Number of Fisher Scoring iterations: 16
Интерпретация (попытка):
Estimates это логарифм odds (то есть логарифм отношения вероятности одной категории “Сookie” к вероятности другой категории “Rice”). Таким образом мы трансформируем значения вероятности от + бесконечности до - бесконечности. Intercept отражает вероятность принадлежности к категории 2 (в данном случае “Rice”) при условии что все объясняющие переменные (terms) неизменны и равны 0. Estimate для каждой из переменных отражает изменение значения логарифма odds обусловленное данной переменной при условии, что остальные переменные неизменны.
В этой модели с увеличением содержания Total_Lipid, вероятность принадлежности к группе “Riсe” существенно уменьшается (значимо,p-value < 0.001 ) у, так как значение Estimate отрицательно. Также значимыми предикторами являются Бета-каротин и Холин (уровень значимость - 0.01).
exp(fit$coefficients) # можно перейти к коэффициентам (odds) от логарифма
## (Intercept) Beta_Carotene Lycopene Total_Lipid Choline
## 149.3423036 1.0036042 5.2095789 0.5562990 0.8838041